Complejidad polinomial de iteración de políticas para MDP robustos L∞
Descubre cómo la iteración de políticas alcanza tiempo polinomial fuerte para MDPs robustos con conjuntos L∞. Un avance clave en optimización secuencial.
Descubre cómo la iteración de políticas alcanza tiempo polinomial fuerte para MDPs robustos con conjuntos L∞. Un avance clave en optimización secuencial.